Scénario co-construit lors du défi pédagogique du Printemps de l'EMI 2021 à l'issue de la conférence de Guillaume Sire du 7 avril 2021 "La ligne éditoriale du web"
Durée de la séance : 1h 30min
Objectifs de la séance
Découvrir/approfondir le fonctionnement d'un moteur de recherches, la notion d'algorithme
Identifier les enjeux liés aux algorithmes traitant des informations, en particulier ceux des moteurs de recherche classant les pages web
Extrait du programme de SNT⚓
Extrait du programme de Sciences Numériques et Technologie de seconde générale et technologique :
« Moteurs de recherche
Les moteurs de recherche permettent de trouver des informations dans des pages dont on ne connaît pas l'adresse, voire dont on ignore l'existence. La méthode de recherche appelée référencement naturel se décompose en trois grandes activités, réalisées par les moteurs de recherche : (1) le parcours automatique du Web pour collecter les pages visitées (aspiration des pages Web effectuée par des robots) ; (2) l'analyse du contenu des pages et leur indexation sur les mots qu'elles contiennent (constitution d'un annuaire inversé qui associe à chaque terme les URL des pages où il apparaît) ; (3) la troisième activité, réalisée à chaque fois qu'un internaute fait une requête, construit une liste ordonnée des pages (classement) comportant les mots clés de la requête. Leur ordre dépend notamment de leur fréquentation (principe des liens), de leur pertinence (aux mots de la requête), et de l'ordre des termes de la requête. Les concepteurs de site Web peuvent améliorer le référencement de leurs pages en choisissant bien les mots et en les plaçant à des endroits stratégiques dans les pages.
Contenu : Moteurs de recherche : principes et usages.
Capacités attendues : Mener une analyse critique des résultats fournis par un moteur de recherche. Comprendre les enjeux de la publication d'informations. »
Principe du jeu⚓
2 rôles possibles
• équipes « site web d'établissement de Pétaouchnok » :
Actions : piocher un budget de ressources, les allouer entre 3 priorités.
Enjeu : obtenir le meilleur classement dans les pages de résultats des moteurs de recherche suite à la requête « lycée + Pétaouchnock »
• équipes « moteurs de recherche » :
Actions : pondérer des critères de classement des pages web (en tenant compte des contraintes liées à leurs indices de fréquentation et d'éthique), faire tourner un algorithme de classement des pages, afficher une page de résultats à la requête « lycée + Pétaouchnock »
Enjeu : augmenter son indice fréquentation / indice éthique (les 2 n'étant pas vraiment compatibles)
Matériel⚓
Côté « sites web d'établissement » :
- 2 bordereaux papier d'allocation de ressources / équipe (fig 1)
- 1 stylo / équipe
- Jetons « ressources »
- Cartes-ressources (W1 dans fig 4)
- Cartes-actions (W2 dans fig 4)

Côté « moteurs de recherche :
Pour les phases communes (en amont + debrief) :
- Tableau pour noter les interventions des élèves
- Vidéoprojecteur
- Diaporama (téléchargeable ci-après)
Diaporama à télécharger⚓
Matériel à télécharger et imprimer⚓
Déroulement⚓
1°) Avant le jeu (15')⚓
En dialoguant avec la classe, et avec le support du diaporama :
• Définir ensemble ce qu'est un moteur de recherche (cf. programmes SNT)
• Insister sur l'algorithme de classement des résultats, sur lequel nous allons nous concentrer lors de cette séance.
• Préciser que seules 3 classes de critères ont été retenues dans le jeu de rôles suivants, par souci de simplification :
pertinence (est-ce que les mots-clés de la requête de l'utilisateur sont dans la page web indexée par le moteur. Encore mieux si ces mots se trouvent dans le titre de la page, en gras... s'ils sont répétés plusieurs fois),
performance (la page web se charge-t-elle rapidement ? C'est le cas si le site web est hébergé sur de bons serveurs),
fréquence de publication (fraîcheur des infos, mise à jour en tous cas supposée).
Aperçu du diaporama (téléchargeable dans rubrique "matériel") :



Expliquer le contexte de jeu, le matériel :
Trois sites web d'établissement se situant dans la grande ville de Pétaouchnok (Jules Ferry, Jules Verne et Jules Michelet) souhaitent être les mieux positionnés possible dans la page de résultats de moteurs de recherche quand l'internaute tape les mots-clés : “Lycée” + “Pétaouchnok”.
Pour cela, les établissements disposent de ressources (humaines, financières...) qu'ils vont répartir pour améliorer soit la pertinence, soit la fréquence de publication, soit la performance de leur site. Plus ils mettront de ressources (matérialisées par des jetons) sur un des critères, plus ils risquent d'être mieux classés par les moteurs. A condition que ceux-ci accordent de l'importance à ce critère.
En effet, dans leur algorithme, les moteurs ZEN, MIAM et MEDOR peuvent choisir la pondération qu'ils veulent accorder à chaque critère. La pondération est-elle aussi matérialisée par des jetons. Au départ, chaque moteur dispose de 10 jetons, et ils peuvent les répartir comme bon leur semble : mettre les 10 sur un seul critère, ou les répartir entre 2 critères, ou bien encore les répartir entre les trois. Enfin presque... il y a une petite contrainte qui dépend de leurs indices. En effet, vous verrez que les moteurs sont également notés : sur leur fréquentation (ils ont une plus ou moins grande part sur le marché des moteurs de recherche, autrement dit, ils sont plus ou moins utilisés par les internautes) ; ils ont également un indice éthique (leurs actions ont une influence sur la société en termes économiques et sociaux, et environnementaux).
2°) Le jeu (50')⚓
La maître du jeu guide chaque manche.
Côté sites web :
Côté moteurs de recherche :
Présentation du matériel (5')
Les sites web disposent de 2 bordereaux à leur nom qui leur permettront de faire des choix d'allocation de ressources et de les communiquer aux moteurs de recherche.
Les moteurs de recherche, derrière leur cache (où figurent leurs indices de fréquentation et d'éthique, ainsi que l'ordre d'apparition des pages web dans leur page de résultat), disposent d'une sorte d'ardoise effaçable. Sur celle-ci, ils pourront pondérer les critères de leur algorithme, calculer le score et donc le rang de chaque page web d'établissement (ou autres pages) dans sa page de résultat quand les mots-clés “lycée Pétaouchnok” sont saisis dans la barre de recherche.
Première manche - Temps 1 (15')
• Distribuer les bordereaux d'allocation de ressources aux sites web,
• Leur faire piocher une carte pour connaître leur budget / ressources et leur distribuer le nombre de jetons correspondant
• Consigne : “Répartissez vos ressources (jetons) entre 3 priorités : pertinence, fréquence de publication, performance. Puis remplissez le bordereau que vous donnerez ensuite aux moteurs.”
• Positionner le tableau cache moteur devant chaque équipe et distribuer 1 feutre effaçable par équipe.
• Faire piocher une carte M1 pour connaître les indices de fréquentation et d'éthique du moteur.
• Consigne : « colorier les étoiles des indices sur le cache en fonction de ce qu'indique votre carte »
• Distribuer 10 jetons de pondération et l'affiche A3 algorithme par équipe.
• Consigne : " Pour compléter votre algorithme qui comprend 3 critères, choisissez une pondération pour chacun (entre 0 et 10) en répartissant vos 10 jetons entre 3 critères : pertinence, fréquence de publication, performance."
Attention, il y a une règle à respecter (cf. face interne du cache) :
Vos indices « fréquentation » et « éthique » sont des contraintes de pondération minimales pour les critères « performance » et « pertinence ».
Ex :
Si fréquentation : 4*, alors performance > ou = 4
Si éthique : 2*, alors pertinence > ou = 2”
Première manche - Temps 2 (15')
• Chaque page web envoie son bordereau aux moteurs.
• Les moteurs reçoivent un bordereau.
• Consigne : « Reportez les valeurs correspondant à chaque critère (pertinence, fréquence, performance) de la page web sur votre fiche-ardoise algorithme. » Remarque : la copie est facilitée par les couleurs et les formes (1 couleur = 1 critère ; 1 forme = 1 site web).
• Les bordereaux passent de moteur en moteur. Les moteurs font la même opération de report sur leur fiche algorithme pour chaque page web, tout en restant cachés derrière leur tableau-cache.
• Consigne : « Calculez le score de chaque page web, puis classez-les dans l'ordre décroissant de leur score sur la face visible de votre tableau-cache. »
• Les pages web récupèrent leurs bordereaux.
Consigne : « Consultez votre classement sur les tableaux des moteurs, puis regardez les bordereaux de vos concurrents. Enfin, discutez en équipe : essayez de deviner quelles sont les pondérations attribuées par les moteurs aux 3 critères, à peu près. Faites des hypothèses. »
Deuxième manche - Temps 1 (10')
• Consigne 1 : « D'abord modifiez votre allocation de ressources en fonction de vos hypothèses à propos des algorithmes des moteurs. Écrivez votre nouvelle allocation sur le 2e bordereau. »
• Laisser quelques minutes pour compléter le bordereau, puis annoncer ...
• Consigne 2 : « Piochez une carte “action” (W2) et modifiez votre allocation de ressources en fonction de ce que la carte indique. »
Consigne : « Piochez une carte “action” (M2) et modifiez vos indices sur le tableau en fonction de ce que la carte indique. Puis, si nécessaire modifiez votre allocation de points-jetons, sans bouleverser totalement votre premier algorithme. Pour cela, nous vous demandons de ne pas déplacer plus de 2 jetons. Si la carte piochée vous a déjà fait déplacer 2 jetons, vous ne pouvez plus en déplacer. »
Deuxième manche - Temps 2 (5')
Chaque page web envoie son 2e bordereau aux moteurs, puis le récupère après qu'il soit passé entre les mains de tous les moteurs. (Idem Manche 1 – temps 2)
Réception d'un bordereau, faire tourner, reporter les valeurs des critères pour chaque page, calculer le score et le reporter sur le podium de la face visible du cache. (Idem Manche 1- Temps 2)
3°) Debriefing (20')⚓
Plusieurs pistes pour mener cette phase cruciale qui va permettre d'expliquer et d'institutionnaliser des concepts, à partir de ce qu'auront vécu les élèves.
a) Poser successivement les questions suivantes en s'adaptant aux réactions des élèves.
« Que retenez-vous de ce jeu de rôle ? Qu'avez-vous remarqué, appris ? »
« Pensez-vous que cela se passe ainsi dans la réalité ? Qu'est-ce qui est pareil / différent dans la réalité ? »
L'enseignant note au tableau les remarques et tente de les classer, regrouper.
S'inspirer des apports de la conférence de Guillaume Sire (cf. section ci-dessous).
b) Éventuellement, reprendre les « cartes action » piochées par les sites web (W2) et les moteurs (M2) et faire expliquer pourquoi les indices ou les ressources augmentent ou diminuent.
c) Faire rejouer les élèves en inversant les rôles (moteurs / sites web).
d) Interroger les élèves et lancer le débat : « Pour les moteurs : difficile de concilier fréquentation et éthique. Quel serait votre algorithme préféré ? Comment pourrait-on concevoir un algorithme éthique ? »
Quelques apports extraits de la conférence de Guillaume Sire, « La ligne éditoriale des algorithmes » du 7-04-21⚓
Un algorithme (quel qu'il soit, en particulier quand il traite l'information, comme celui d'un moteur de recherche) n'est pas neutre. C'est une production sociale que l'on peut interroger. En l'occurrence, c'est le fruit de plusieurs arbitrages, dont :
• Le choix de critères (ou variables) pour classer des résultats de recherche
• Le poids que l'on attribue à chacun
Parallèle avec le jeu : seul ce 2e arbitrage a été effectué par les moteurs du jeu (par souci de simplification). D'ailleurs Guillaume Sire évoque aussi les constantes, pas du tout abordées dans le jeu.
Globalement, on compte 6 classes principales de critères des algorithmes des moteurs de recherche :
• Pertinence (analyses lexicométriques) = récurrence (index), densité (combien de mots dans la page... nb de citations / nb de mots), position/ancres (+/- tôt, dans le titre...)
• Performance (vitesse de chargement des pages, site responsive ou non, accessibilité...)
• Fréquence de publication
• Centralité (pagerank : + un site aura d'autorité, + il sera au centre)
• Signaux sociaux (commentaires, réponses ou non de l'auteur, likes, tweets... (quelle force les uns par rapport aux autres)
• Personnalisation (langue, position géographique, historique...)
Parallèle avec le jeu : On n'a d'ailleurs pas utilisé les 6 classes identifiées, sachant d'ailleurs qu'il y a un grand nombre de critères derrière chaque classe (6 classes/points mesurés, 200 à 300 critères pour Google). Dans le jeu, on a essayé de lier les indices fréquentation et éthique des moteurs avec leur pondération. Normalement, c'est leur comportement dont leur pondération qui a un impact sur leur fréquentation et la perception de leur éthique par les Internautes. (Par exemple : la prise en compte de la « vitesse de chargement » des pages web indexées privilégie les plus « riches » (ce qui n'est pas très éthique, voire diminue la pertinence des résultats), la personnalisation des résultats grâce notamment à l'utilisation de cookies entre en conflit, parfois, avec le respect des droits des internautes (cf. RGPD) ...
Dans la réalité, Google détient plus de 90% des PDM en France, en Europe également (cf. diapo debrief)
Différence avec le jeu : les moteurs piochaient pour connaître leurs indices de départ. Dans le jeu, on ne peut pas bien retranscrire l'importance de l'historique des moteurs de recherche, leur création, leurs choix, les conditions structurelles de ce marché.
Les algorithmes des moteurs sont toujours un peu secrets (surtout Google, d'autres les publient, mais ils ont beaucoup moins de PDM).
Parallèle avec le jeu : oui, c'est pour cela qu'on a installé ces tableaux qui cachent les algorithmes des moteurs, dont les choix ne sont jamais communiqués aux sites web. Ceux-ci essaient de deviner ... et font parfois appel à des professionnels du référencement.
La « ligne éditoriale » des moteurs de recherche (choix de variable + pondération + constante) induit des « lignes éditoriales » chez les sites/pages web, également appelées des normes de publication. C'est le jeu légal du SEO (Search Engine Optimization).
Parallèle avec le jeu : les sites/pages réagissent à leur premier classement par les moteurs de recherche et modifient l'allocation de leurs ressources pour le 2e tour.
Captation vidéo de la conférence de Guillaume Sire (7 avril 2021)⚓
Durée totale : 1 h 50 min
Disponible également sur la chaîne YouTube de la Canotech
Pour trouver rapidement l'extrait qui vous intéresse :
• 00-03'22 : Introduction par Mme Fetouhi, directrice territoriale Canopé Occitanie
• 03'23 - 13'02: Introduction de Guillaume Sire
• 13'03 - 27'58 : La sociologie des techniques et la production d'algorithmes, interaction sociale
• 27'59 - 45'18 : Les algorithmes et le traitement de l'information
27'59 - 28'12 Les algorithmes et le traitement de l'information
28'12 - 30'34 : suggestion d'activité de débat et de création critique avec des élèves/étudiants
30'35 - 37'29 : définition d'un algorithme
37'30 - 39'59 : l'algorithme de Google, le « Pagerank »
44'00 - 44'45 : proposition de débat critique sur les critères de différents moteurs
44'46 - 45'18 : enjeux démocratiques de la transparence
• 45'19- 53'12 : Les classes de variables
45'19 - 47'09 : les variables de l'affinité, de poids, de temps : exemple de Facebook
47'10 - 53'12 : les 6 classes principales de variables de Google
47'31 : La pertinence
49'57 : La performance
50'05 : La fréquence
50'54 : la centralité
51'33 : les signaux sociaux
52'04 : la personnalisation
• 53'13 - 57'05 : Le secret algorithmique de Google
• 57'06 - 1'04'15 : Influence des algorithmes sur les contenus
58'26 : sur le choix des mots
1'00'22 : sur la mise en forme hypertextuelle
• 1'04'16 – 1'18'16 : Les controverses
1'04'16 La question de la responsabilité
1'11'30 L'interventionnisme manuel
1'12'40 La personnalisation (les bulles de filtre)
1'14'48 Les incitations au favoritisme
• 1'18-1'50 : Questions du public
Aller plus loin : conférence de Guillaume Sire (7 avril 2021)⚓
Durée totale : 1 h 50 min
Disponible également sur la chaîne YouTube de la Canotech
Pour trouver rapidement l'extrait qui vous intéresse :
00-03'22 : Introduction par Mme Fetouhi, directrice territoriale Canopé Occitanie
03'23 - 13'02: Introduction de Guillaume Sire
13'03 - 27'58 : La sociologie des techniques et la production d'algorithmes, interaction sociale
27'59 - 45'18 : Les algorithmes et le traitement de l'information
27'59 - 28'12 Les algorithmes et le traitement de l'information
28'12 - 30'34 : suggestion d'activité de débat et de création critique avec des élèves/étudiants
30'35 - 37'29 : définition d'un algorithme
37'30 - 39'59 : l'algorithme de Google, le « Pagerank »
44'00 - 44'45 : proposition de débat critique sur les critères de différents moteurs
44'46 - 45'18 : enjeux démocratiques de la transparence
45'19- 53'12 : Les classes de variables
45'19 - 47'09 : les variables de l'affinité, de poids, de temps : exemple de Facebook
47'10 - 53'12 : les 6 classes principales de variables de Google
47'31 : La pertinence
49'57 : La performance
50'05 : La fréquence
50'54 : la centralité
51'33 : les signaux sociaux
52'04 : la personnalisation
53'13 - 57'05 : Le secret algorithmique de Google
57'06 - 1'04'15 : Influence des algorithmes sur les contenus
58'26 : sur le choix des mots
1'00'22 : sur la mise en forme hypertextuelle
1'04'16 – 1'18'16 : Les controverses
1'04'16 La question de la responsabilité
1'11'30 L'interventionnisme manuel
1'12'40 La personnalisation (les bulles de filtre)
1'14'48 Les incitations au favoritisme
1'18-1'50 : Questions du public












